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摘 要 : [目的 /意义 ] 金融 科技 在 信息 和 数据 时 代 发 展 迅速 , 专 利 数目 不 断 增 长 ,同时 金融 科技 的 领域 交叉 和 边界 模糊 等 
特性 ,也 提升 了 其 专利 分 析 的 难度 。 因 此 需要 构建 适合 的 识别 与 分 类 方法 ,从 而 准确 高 效 地 处 理 持续 增长 的 大 体 


量 数 据 。 
界 ; 随 后 使 用 机 器 学 


[ 方法/ 过程] 首先 依据 金融 科技 的 内 涵 和 功能 ,梳理 其 包含 的 创新 类 别 ,厘清 金 融 科技 专利 的 范围 和 边 
习 算 法 ,结合 文本 过 滤 、 人 工 判 读 ,构建 金融 科技 专利 识别 与 分 类 的 方法 流程 。 


[ 结果/ 结论] 


提出 一 种 基于 机 器 学 习 算 法 的 专利 识别 与 分 类 流程 ,能 够 较为 准确 高 效 地 识别 金融 科技 专利 并 进行 分 类 ,并 通过 
分 析 所 得 的 金融 科技 专利 分 类 数据 ,总 结 当前 金融 科技 的 发 展现 状 。 
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伴随 着 大 数据 ` 云 计算 以 及 人 工 智 能 等 的 发 展 和 
逐渐 成 部 ， 新 技术 在 金融 行业 的 应 用 更 加 广泛 ,金融 与 
和 的 深度 融合 促进 了 金融 科技 (Financial Technolo- 
EnTech) 的 发 展 ， 被 认为 是 金融 行业 在 信息 时 代 发 
自 鸭 一 次 深刻 变革 与 创新 "“。 与 此 同时 ， 金融 科技 
楷 沪 的 专利 申请 和 授权 数目 持续 增长 ， 已 经 成 为 企业 
进 得 市 场 布 局 的 重要 渠道 之 。 因 此 ,准确 地 检索 金 
本 种 技 专利 1 并 对 其 进行 分 析 , 有 助 于 识别 金融 科技 领 
域 网 他 新 ,分 析 最 有 具 发 展 潜力 的 分 文 以 及 行业 应 用 ,从 
而 把 握 金融 科技 的 发 展 动态 ， 助力 国家 产业 和 微观 企 
业 的 战略 性 布局 。 

金融 科技 作为 金融 与 科技 的 交叉 领域 ,对 其 的 专 
利 识别 和 分 析 存 在 两 大 难点 。 一 方面 ,金融 科技 所 涉 
及 的 技术 范围 非常 广泛 , 且 目 前 对 其 的 界定 相对 模糊 ， 
此 较 难 直接 依据 传统 国际 专利 分 类 ( International 
Patent Classification ，IPC ) 或 者 确定 关键 词 的 方法 进行 
识别 和 分 析 。 男 一 方面 ,近年 来 随 着 金融 科技 的 迅速 
发 展 ,相关 领域 的 创新 成 果 和 专利 数目 持续 增长 ,因此 
需要 构建 适合 的 检索 流程 ,从 而 能 够 迅速 地 从 海量 专 
利 数据 中 ,准确 识别 不 同类 别 的 金融 科技 创新 。 对 此 ， 
本 研究 从 金融 科技 的 内 涵 和 功能 出 发 ,通过 梳理 其 所 


包含 的 创新 类 别 ,对 金融 科技 专利 的 范围 进行 合理 界 
定 。 同 时 ,创新 性 地 提出 一 种 使 用 机 器 学 习 的 算法 ,并 
结合 文本 过 滤 和 人 工 判读 的 方法 流程 ,进行 金融 科技 
专利 识别 与 分 类 。 随 后 ,依据 所 得 分 类 专利 数据 ,分 析 
金融 科技 的 技术 布局 和 发 展现 状 。 此 外 ,本 研究 的 方 
法 对 类 似 的 新 兴 交 叉 领 域 专利 分 析 , 同 样 具 有 一 定 借 
鉴 作 用 。 


1 相关 研究 


1.1 金融 科技 相关 研究 
近年 来 学 术 界 对 金融 科技 的 关注 度 持续 上 升 , 研 
究 视角 涵盖 金融 科技 的 具体 技术 创新 与 应 用 ”” \ 传 
统 金融 行业 面临 的 挑战 与 机 遇 - “以 及 相应 的 风险 
防 控 和 市 场 监管 ” “等 问题 ,但 鲜 有 学 者 从 专利 的 角 
度 对 金融 科技 的 发 展 进行 探索 。 金融 科技 专利 能 
创造 巨大 的 市 场 价值 ” ,准确 识别 不 同类 型 的 金融 
科技 专利 ,对 于 追踪 技术 发 展 动态 、 分 析 创 新 的 影响 
因素 .助力 国家 金融 科技 布局 亦 具 有 重要 意义 。 在 
少数 与 金融 科技 专利 相关 的 研究 中 , 赵 星 在 IPC 号 
G06Q 中 ,对 涉及 人 脸 识别 大 数据 分 析 预 测 \ 人 工 智 
能 技术 以 及 数字 货币 等 方向 的 金融 科技 专利 进行 检 


# 本 文系 国家 自然 科学 基金 青年 项 目 “ 银 行业 竞争 政策 的 实施 效果 及 影响 机 制 研究 ”( 项 目 编号 :71903189 ) 和 中 国 博 士 后 科学 基金 项 目 “ 多 
元 所 有 制 银行 市 场 中 强化 竞争 的 风险 和 福利 效应 "(项 目 编号 :2019M660052 ) 研究 成 果 之 一 。 
作者 简介 : 徐 璐 (ORCID.: 0000 -0003 -2414 -3180) ,讲师 ,博士 ; 卢 小 宾 (ORCID:0000 -0002 -2866 -4509 ) ,信息 分 析 研 究 中 心 主任 ,教授 ， 


博士 ,博士 生 导 师 ,通讯 作者 ,E-mail:luxb@ruc. edu. cn; 杨 冠 灿 (ORCID. 0000 -0002 -1706 -1884) ,讲师 ,博士 。 


收 稿 日 期 :2019 -12 -23 修 回 日 期 :2020 -03 -14 本 文 起 止 页 码 :87 -95 本 文责 任 编辑 : 王 传 清 


87 


团 定 情报 三 作 


第 64 卷 第 11 期 2020 年 6 月 


ChinaXiv 合 作 期 刊 


索 和 统计 ,指出 我 国 金融 科技 领域 的 专利 布局 相对 
较为 薄弱 ”。 具 有 全 球 影响 力 的 知识 产权 媒体 IPR- 
daily 联合 incoPat 创新 指数 研究 中 心 ,发 布 “2019 年 全 
球 金 融 科技 发 明 专利 排行 榜 (TOP100 名 )” ,报告 通 
过 限定 IPC 号 G06Q20 .G06Q30 .C06Q40 ,针对 金融 、 文 
付 、 购 物 .电子 商务 保险、 税务 等 几 大 应 用 领域 ,统计 
2019 年 全 球 企业 公开 的 金融 科技 发 明 专 利 申请 数量 。 


因此 , 面 对 海 量 的 专利 数据 ,本 研究 的 主要 内 容 有 以 下 
3 个 方面 :DD 人 工 判 读 梳理 金融 科技 的 创新 类 别 ,厘清 
金融 科技 专利 范围 ,作为 后 续 金 融 科技 专利 的 识别 和 
分 析 的 基础 ;@ 使 用 机 器 学 习 算 法 ,结合 文本 过 滤 和 人 
工 判 读 , 构 建 一 套 能 够 处 理 大 体 量 专 利 数据 、 对 金融 科 
技 专 利 进 行 识别 和 分 类 的 方法 流程 ;@@ 结 合 所 得 的 分 
类 专利 数据 ,分 析 金 融 科 技 创新 的 类 型 分 布 和 业务 应 


上 述 金 融 科技 专利 的 研究 和 实践 工作 ,一 般 仅 限定 单 
个 或 少数 几 个 IPC 号 进行 检索 ,不 能 全 面 覆盖 金融 科 
技 创新 的 所 有 专利 ,难以 确保 检索 结果 的 全 面 性 和 有 
效 性 。 
1.2 专利 识别 相关 研究 

传统 的 专利 识别 或 者 专利 检索 , 常 使 用 IPC 号 和 
关键 词 的 检索 方式 。IPC 号 是 一 种 国际 通用 的 管理 和 
利于 专利 文献 的 工具 ,记载 每 条 发 明 与 实用 新 型 专利 
信息 的 “分 类 号 "和 * 主 分 类 号 "项 ,因此 被 广泛 应 用 于 
本 市 的 分 类 和 检索 ”"。 一 方面 ,使 用 IPC 号 ,可 以 
通 台 构建 专利 分 类 与 产业 分 类 的 对 照 关系 ,实现 快速 
检索 和 调用 特定 产业 专利 信息 的 目的 5 ,包括 专家 判 
乱 交 又 检索 ,概率 计算 以 及 相似 度 等 多 种 关联 模 
焉 4。 另 一 方面 ,结合 PC 号 和 关键 词 ,能 够 进 一 
肯 售 化 检索 方法 ,提高 专利 的 识别 效率 ”” 。 但 是 ， 
学 车 和 实践 工作 者 也 指出 , 随 着 技术 的 发 展 ,在 例如 知 
能 主机 和 药品 等 众多 领域 ,专利 识别 和 检索 都 面临 着 
跨 颖 域 .技术 体系 繁杂 等 挑战 ,使 得 基于 IPC 号 的 传统 
检索 方法 效果 不 理想 -2 。 同 样 ,金融 科技 作为 快速 
发 展 的 新 生 事物 , 亦 存在 概念 界定 模糊 和 领域 交叉 等 
问题 。 在 海量 的 数据 中 ,难以 直接 利用 IPC 号 ,进行 准 
确 且 规模 化 的 专利 识别 与 分 析 。 因 此 ,需要 针对 性 地 
构建 此 类 问题 的 专利 识别 的 方法 流程 。 近 年 来 ,使 用 
机 器 学 习 算法 的 数据 分 析 方法 得 到 快速 发 展 ,被 广泛 
应 用 于 科学 技术 、 经 济 金融 等 领域 的 问题 研究 -2 。 
机 器 学 习 算 法 能 够 对 各 类 文本 数据 进行 批量 的 向 量化 
处 理 , 与 人 工分 析 相 结合 ,可 以 更 高 效 地 在 海量 数据 中 
分 析 各 类 问题 所 -55 ,为 金融 科技 专利 的 识别 和 分 类 工 
作 提 供 了 一 种 新 的 思路 。 

综 上 来 看 ,已 有 关于 金融 科技 的 研究 ,多 关注 技术 
本 身 , 探 讨 金 融 科技 具体 的 创新 场景 和 应 用 、 市 场 影响 
以 及 政策 法 规 等 方面 ,但 针对 专利 数据 的 研究 工作 较 
少 。 同 时 ,金融 科技 是 金融 与 科技 交叉 的 新 兴 领 域 , 专 
利 数目 持续 增长 ,传统 IPC 号 的 检索 方法 难以 完全 涵 
盖 金 融 科技 的 全 部 领域 。 另 外 ,金融 科技 并 没有 明晰 
的 概念 界定 ,构建 准确 全 面 的 关键 词 表 亦 存在 困难 。 


j ,从 而 掌握 金融 科技 发 展现 状 。 
2 ”金融 科技 专利 识别 和 分 类 的 流程 与 方法 


2.1 流程 框架 

本 研究 提出 一 种 使 用 机 器 学 习 、 结 合 文本 过 滤 和 
人 工 判读 的 金融 科技 专利 识别 和 分 类 流程 框架 :第 一 ， 
构建 金融 词汇 列表 ,对 涵盖 金融 科技 必要 技术 的 G 和 
H 类 所 有 专利 数据 进行 文本 过 滤 , 从 而 获取 与 金融 相 
关 的 ,所 有 可 能 为 金融 科技 专利 文献 的 标题 和 摘要 等 
信息 ,并 进行 分 词 和 TF-IDF 特征 提取 。 第 二 ,依据 金 
融 科技 的 内 涵 和 功能 ,人 工 梳理 总 结 金融 科技 创新 类 
别 ,从 而 界定 金融 科技 专利 的 范围 ;进一步 通过 两 次 人 
工 判读 并 结合 K-means 算法 ,合理 构建 样本 集 。 第 三 ， 
随机 抽取 并 切 分 样本 数据 ,在 训练 集中 进行 机 器 学 习 
算法 的 参数 调 优 ; 随后 在 测试 集中 进行 测试 ,综合 考虑 
各 算法 的 准确 率 、 精 确 率 、 召 回 率 和 FTl 值 确定 最 优 模 
型 ;并 进行 全 数据 集 的 专利 识别 和 分 类 。 最 终 构成 数 
据 采集 -样本 选择 -模型 构建 的 核心 流程 框架 ,如 图 
1 所 示 。 图 1 中 蓝 色 实心 矩形 为 主要 机 器 学 习 算法 ， 
橙色 实心 矩形 为 凭借 金融 学 专业 知识 的 人 工 干 预 和 判 
别 ,绿色 实心 矩形 为 文本 过 滤 过 程 。 因 此 ,在 文本 过 波 
获取 专利 数据 的 基础 上 ,整个 处 理 流程 始终 由 机 器 学 
习 算 法 所 贯穿 ,并 与 人 工 判别 进行 交互 ,综合 对 金融 科 
技 专利 进行 识别 和 分 类 。 
2.2 数据 集 构建 及 文本 预 处 理 
2.2.1 数据 采集 

本 研究 的 数据 来 源 于 lens 专利 数据 库 ,该 数据 库 
由 Cambia 和 昆士兰 州 理工 大 学 联合 开发 ,提供 开放 性 
全 球 专利 信息 与 学 术 文 献 数据 ,更 新 周期 为 3 -4 周 ， 
涵盖 了 美国 专利 局 2001 年 以 来 的 专利 申请 及 1976 年 
以 来 的 专利 授权 的 全 文 和 图 像 。 美 国 在 全 球 金融 科技 
发 展 中 处 于 领先 地 位 ,因此 本 研究 以 美国 的 专利 授权 
数据 作为 研究 对 象 。 本 研究 关注 近 5 年 的 金融 科技 专 
利 授 权 情 况 ,检索 时 间 限 定 在 2014 年 1 月 1 日 至 2018 
年 12 月 31 日 ,检索 到 全 部 美国 授权 专利 共 1 528 774 
条 记录 。 
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@ 随 后 ,为 初步 了 解 金 融 科技 专利 ,本 研究 使 用 金融 
科技 必要 技术 相关 的 术语 ,如 “big data”“ cloud compu- 
6 到 “AT" 等 在 数据 集中 进行 检索 ,结果 显示 国际 专利 
分 美 号 集中 在 G( 物 理 ) 和 于 (电学 ) 部 类 。 因 此 ,本 研 
究 通 一 步 将 IPC 分 类 号 限定 在 G .H 两 个 部 类 ,其 能 
涵盖 金融 科技 所 必须 包含 的 电子 计算 类 技术 的 所 有 专 
种 ,此 过 程 删 除了 1 328 623 条 数据 ,剩余 200 151 条 记 
录 G5 
.和 最 后 ,本 研究 构建 金融 词汇 列表 ,通过 词 表 过 滤 的 
进一步 缩小 数据 集 。 借 鉴 M，Chen 等 构建 的 金融 
词汇 列表 ” ,该 列表 结合 C. R， Harvey 金融 词汇 表 及 
牛津 金融 词典 中 的 单词 及 词组 ,提取 出 能 够 明确 体现 
与 金融 服务 相关 联 的 单词 (如 bourse .chargeback 、 人 i- 
tures security bank 等 ) ,以 及 与 金融 服务 相关 的 词组 
(如 health insurance .mutual fund 等 ) 。 在 此 基础 上 ,本 
研究 加 入 部 分 最 近 被 确认 为 金融 科技 术语 的 新 单词 
(如 digital currency ,smart contract 等 ) ,最 终 形成 478 个 
与 金融 服务 密切 相关 的 金融 词汇 表 ( 由 于 篇 幅 所 限 暂 
且 不 报 , 备 索 )。 使 用 金融 词汇 表 , 进 一 步 过 滤 掉 在 专 
利文 件 标 题 和 摘要 中 不 包含 表 中 任何 金融 词汇 的 专 
利 , 共 162 995 条 数据 。 最 终 得 到 37 156 条 专利 记录 
作为 专利 分 析 数 据 集 ,内 容 涵盖 每 条 专利 的 标题 .摘要 
和 权利 要 求 项 等 全 部 详细 数据 。 数 据 集 的 构建 过 程 如 
表 1 所 示 : 
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图 1 金融 科技 专利 识别 和 分 类 方法 流程 


表 1 专利 分 析 数 据 集 构建 


Wi oe 
2014 年 1 月 到 2018 年 12 月 美国 授权 的 所 有 专利 1 528 774 
去 除 IPC 号 不 为 G 和 H 的 专 和 和 200 151 
去 除 标 题 摘要 不 包含 金融 词汇 列表 中 术语 的 专利 37 156 


2.2.2 文本 预 处 理 

文本 预 处 理 环节 使 用 KNIME 的 文本 挖掘 模块 。 
首先 对 原始 文本 进行 分 词 处 理 。 以 OpenNLP Fnglish 
Tokenization 分 词 器 为 工具 ,以 词 、 标 点 符号 以 及 数字 
等 进行 分 词 ,保留 标点 符号 ;之 后 去 除 标 点 符号 、 纯 数 
字 、 含 有 异常 字符 .长度 小 于 3 的 词 项 及 常用 停 用 词 词 
表 中 的 词 项 ,如 be .the that 等 。 利 用 Stanford tagger 标 
注 工具 筛选 名 词 及 名 词 词组 ;最 后 ,使 用 Stanford lem- 
matizer 词 形 还 原 工 具 进 一 步 整合 相关 词汇 ,减少 黄 文 
语 境 下 时 态 .语气 对 词 项 的 影响 ,最 终 实现 金融 科技 相 
关 专 利 的 文本 处 理 , 将 专利 文本 语言 转化 为 重要 词 项 
组 成 的 词组 。 

随后 ,将 文本 进行 向 量化 表示 ,设置 特征 词 的 数量 
为 3 000 维度 。 词 袋 模型 是 较为 常用 的 将 句子 转换 为 
向 量 表示 的 模型 ,该 模型 不 考虑 单词 在 句子 中 的 顺序 ， 
仅 考 虑 词 表 中 单词 在 文本 中 出 现 的 次 数 。 本 研究 在 词 
袋 模型 的 基础 上 用 词 频 - 逆 文 本 频率 (Term Frequency 
- Inverse Document Frequency,TF-IDF ) 代替 单纯 的 词 
频 ,进行 词 袋 模型 的 构建 。TF-IDF 方法 是 较为 常用 的 
文本 特征 向 量化 方法 ,用 以 评估 词 对 语料库 中 一 份 文 
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件 的 重要 程度 。 其 优点 是 既 考虑 高 频 词 的 影响 ,同时 
又 使 用 道 文本 频率 对 词 频 进行 加 权 处 理 , 即 某 一 单词 
在 该 文档 出 现 的 次 数 越 多 则 重要 性 越 高 ,但 如 果 在 越 
多 的 文档 中 出 现 ,那么 其 在 分 类 过 程 中 的 重要 性 就 越 
小 ,以 此 反映 某 一 单词 将 当前 文档 与 其 他 文档 区 分 的 
能 力 ,具体 计算 公式 如 下 ; 

p(w) = 单词 w 在 该 文档 中 出 现 的 次 数 


文档 的 单词 总 数 
公式 (1) 
文档 集中 文档 的 总 数 
1DF(w) =log( 在 舍 词 的 文档 数 + 
公式 (2) 
TF-IDF(w) =TF(w) #IDF(w) 公式 (3) 


2.3 ”金融 科技 专利 样本 集 构建 
2.3.1 厘清 金融 科技 专利 范围 和 类 别 

金融 科技 作为 全 新 概念 ,其 具体 内 涵 并 没有 完全 
一 致 和 明确 的 界定 ,如 表 2 所 示 ,不同 机 构 和 组 织 从 各 
自 的 角度 给 出 了 金融 科技 的 定义 ,但 是 都 强调 了 新 兴 
技术 在 金融 科技 领域 的 重要 作用 。 与 此 同时 ,国内 学 
者 也 从 多 维度 对 金融 科技 的 内 涵 进 行 了 阐述 。 如 韩 梅 
出 金融 科技 是 金融 和 信息 技术 的 融合 型 产业 ,内 涵 
在 于 以 数据 和 技术 为 驱动 来 提升 金融 行业 整体 运行 效 
率 ,降低 行业 经 营 成 本 。 叶 纯 青 认为 金融 科技 是 互 
联网 金融 的 进一步 发 展 ,通过 技术 与 金融 的 融合 提升 
服务 效率 和 客户 体验 。 


表 2 金融 科技 的 内 酒 


涵义 


O16 国际 金融 稳定 理事 会 
天 方式 产生 重大 影响 
人 Cji7 美国 国家 经 济 委员 会 

17 国际 证 监 会 组 织 


前 沿 技术 带 来 的 金融 创新 , 它 能 创造 新 的 业务 模式 应 用 流程 或 产品 ,从 而 对 金融 市 场 . 金 融 机 构 或 金融 服务 的 提供 


对 付款 投资 管理 .募集 资金 . 存 贷 款 、 保 险 ,监管 合 规 以 及 金融 服务 领域 的 众多 活动 产生 影响 的 大 范围 技术 创新 
有 潜力 改变 金融 服务 行业 的 各 种 创新 的 商业 模式 以 及 新 兴 技 术 


< 对 于 人 金融 科技 本 身 及 其 包含 的 技术 类 型 ,尽管 国 
再 强 组织 和 学 者 有 着 不 同 的 认识 ,但 是 都 普遍 认同 金 
融 釉 技 的 核心 是 金融 与 科技 的 融合 ,是 新 技术 在 金融 
领域 的 应 用 , 从 而 实现 金融 行业 效率 的 提升 和 成 本 的 
节约 。 在 此 基本 内 涵 下 ,前 沿 科技 与 金融 不 断 融 合 的 
过 程 ,催生 了 多 种 金融 科技 领域 的 技术 创新 。 本 研究 
所 从 析 的 金融 科技 专利 , 亦 指 能 够 应 用 于 金融 领域 各 
项 路 务 和 流程 的 前 沿 技术 性 创新 。 

3 己 目 前 金融 科技 创新 分 类 方法 主要 有 两 大 模式 :一 
是 岗 金 融 科技 在 金融 行业 的 应 用 方向 进行 划分 ;二 是 
依据 金融 科技 的 底层 技术 进行 划分 。 如 金融 稳定 理事 
会 (Financial Stability Board ,FSB ) 在 2017 年 从 行业 应 


用 角度 ,按照 支付 管理 . 存 贷款 与 资本 筹集 、 投 资 管理 、 
市 场 设施 \ 保 险 五 大 经 济 功能 进行 分 类 ,并 进一步 结合 
底层 技术 细 分 了 物 联网 .电子 交易 、 云 计算 、 大 数据 、 知 
能 投 顾 \ 分 布 式 账本 、 电 子 身 份 认证 、 移 动 支付 等 类 别 。 

在 充分 了 解 金融 科技 的 内 涵 和 底层 技术 及 其 在 金 
融 领 域 应 用 的 基础 上 ,通过 阅读 数据 集中 的 专利 文献 ， 
本 研究 依据 金融 科技 的 内 涵 和 功能 ,提出 将 金融 科技 
专利 划分 为 加 密 安全 ,移动 支付 数据 分 析 、 物 联网 络 、 
智能 交易 以 及 网 络 借贷 这 6 个 类 别 的 技术 创新 ,从 而 
明确 金融 科技 专利 的 内 容 和 边界 ,为 构建 准确 的 专利 
识别 和 分 类 方法 提供 基础 。 具 体 分 类 和 应 用 实例 等 如 
表 3 中 所 示 。 


表 3 金融 科技 专利 分 类 的 详细 描述 与 具体 举例 


类 别 描述 与 应 用 实例 具体 专利 
加 密 安全 为 金融 网 络 系统 运行 以 及 金融 交易 等 提供 安全 保障 的 技术 ,应 用 于 例如 金融 欺诈 识 US 10089683 B2:Fraud Reduction System For Trans- 


别 ,加密 货币 等 
移动 支付 


手机 支付 .可 穿戴 设备 支付 等 


数据 分 析 昔 助 大 数据 和 前 沿 的 分 析 方 法 ,解决 实际 金融 问题 的 技术 ,应 


义 移动 终端 设备 为 载体 ,借助 近 场 通信 等 方式 实现 支付 与 结算 的 技术 ,应 用 于 例如 


actions 


US 10083443 Bl1 : Persistent Authentication Of A 


Wearable Device 


目 
险 管理 等 


物 联网 络 基于 互联 网 基础 的 拓展 网 络 , 实 现 物 与 人 的 互联 互通 的 技术 ,应 用 于 例如 物 联 网 智 
能 


柜台 \ 物 联网 征 信 等 


于 例如 精准 营销 \ 风 US 10120923 B2:Data Discovery And Analysis Tool 


US 10068278 B2 :System And Method For Purchasing 


Merchandise Based On Radio Frequency Recognition 


智能 交易 根据 客户 多 种 交易 需求 ,通过 智能 算法 和 产品 来 蔡 代 人 了 
例 


如 智慧 合约 ,智能 投 顾 等 
了 有 


网 络 借贷 并 


E 供 服务 的 技术 ,应 用 于 


US 9721251 Bl1: Intelligent Capture In Mixed Fulfill- 


ment Transactions 


有 互联 网 平台 ,以 更 加 多 样 化 的 形式 促成 资金 借贷 双方 交易 的 技术 ,应 用 于 例如 


US 8676674 B2 : Peer-to-peer And Group Financial 
Management Systems And Methods 
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2.3.2 结合 机 器 学 习 算 法 和 人 工 判 读 构 建 样本 集 
首先 ,人 工 阅 读 分 类 ,构建 初始 样本 。 使 用 金融 科 

技 创 新 企业 名 单 ” 和 金融 科技 高 度 相关 的 术语 (如 
mobile transaction、 mobile payment, internet security 、in- 
ternet of things 、blockchain 等 ) ,在 数据 集中 进行 初步 检 
索 , 得 到 765 条 专利 数据 。 表 3 概括 了 金融 科技 的 6 
个 具体 类 别 ,同时 数据 集中 还 包含 不 是 金融 科技 的 专 
利 数据 ,分 别 记 为 :第 7 类 , 即 “ 与 金融 相关 但 非 金 融 科 
技 的 专利 ” ,包括 一 些 金 融 类 的 纯 商 业 方法 、 外 观 设计 
等 ,这 些 专 利 虽 然 与 金融 相关 ,但 与 金融 科技 是 “应 用 
于 金融 业务 和 流程 的 前 沿 技 术 ” 的 内 涵 不 吻合 ;第 0 
类 , 即 “ 与 金融 不 相关 的 专利 ” ,包括 一 些 没 有 具体 可 
行 的 金融 应 用 场景 的 、 纯 技术 性 的 创新 专利 。 因 此 ,0 
- 太 分 类 可 以 完全 涵盖 数据 集中 的 全 部 类 别 ,其 中 1 - 
6 类 为 金融 科技 专利 。 通 过 人 工 阅 读 专利 文献 的 标 
题 狂 要 ,对 765 条 专利 数据 进行 标注 ,初始 分 类 结 
姓 注 4" 初始 样本 " 列 所 示 。 

与 随后 ,使 用 K-means 的 方法 拓展 样本 集 。 有 标注 


准 本 与 未 标注 数据 集 的 独立 同 分 布 是 进行 监督 学 习 的 


基 矶 前 提 , 即 进行 标注 的 样本 应 该 是 随机 抽取 且 相 互 


|e 


的 。 为 保证 标注 样本 专利 的 随机 性 ,同时 保证 每 
-有 能 够 充分 代表 该 类 的 专利 数量 , 本 研究 在 765 
条 禄 始 分 类 样本 上 ,进一步 拓展 训练 样本 。K-means 
绢 次 算法 是 一 种 迭代 求解 的 聚 类 分 析 算法 ,通过 在 初 
娩 浆 类 样本 的 每 一 类 中 运行 K= 1 的 K-means 算法 ,得 
到 窜 类 金融 科技 专利 的 聚 类 中 心 。 进 而 迭代 计算 全 体 
数据 集中 的 专利 与 各 聚 类 中 心 的 余 疙 距离 ,如 果 一 条 
专利 的 余弦 距离 到 初始 样本 中 某 一 类 别 的 聚 类 中 心 最 
短 ,即将 该 专利 归 入 该 类 别 。 利 用 初始 分 类 样本 ,本 研 
究 使 用 K-means 的 方法 对 全 部 数据 集 进行 聚 类 ,在 每 
类 中 选取 离 聚 类 中 心 最 近 的 100 篇 专利 ,并 随机 抽取 
100 篇 专利 作为 补充 。 因 此 , 既 能 够 保证 选取 到 每 类 
的 基本 特征 ,同时 增加 抽取 的 随机 性 ,使 得 对 整体 的 代 
表 性 更 好 ,最 终 得 到 8 类 共 1 600 条 专利 数据 。 

最 后 ,再 次 人 工 阅 读 分 类 , 确定 最 终 样 本 。 对 
1 600 条 样本 再 次 进行 人 工 阅读 与 分 类 标注 ,形成 最 终 
用 于 机 器 学 习 的 专利 识别 与 分 类 的 样本 ,最 终结 果 如 
表 4“ 最 终 样 本 " 列 所 示 。 与 初始 分 类 相 比 ,最 终 样本 
中 的 标注 数量 更 丰富 ,对 整体 数据 集 的 代表 性 更 好 。 
2.4 ”金融 科技 专利 识别 和 分 类 
2.4.1 训练 集 上 进行 参数 调 优 

此 阶段 首先 进行 样本 切 分 ,随机 抽取 样本 的 80% 
作为 训练 集 数据 进行 学 习 训练 和 参数 调 优 , 剩余 20% 


表 4 初始 样本 与 最 终 样本 中 各 类 专利 数量 统计 


(单位 :条 ) 


分 类 编号 分 类 名 称 初始 样本 最 终 样本 
1 加 密 安 全 114 122 
2 移动 支付 113 141 
3 数据 分 析 103 57 
4 物 联 网 络 77 42 
5 智能 交易 87 70 
6 网 络 借贷 48 35 
7 非 金融 科技 109 307 
0 金融 不 相关 114 826 


作为 测试 集 数据 进行 验证 ,使 用 已 标注 的 样本 集 寻 找 
最 优 的 机 器 学 习 模 型 。 常 用 的 机 器 学 习 分 类 算法 包 
括 : 支 持 向 量 机 (Support Vector Machine，SVM ) 、 梯 度 
提升 决策 树 (Decision Tree，DT) 、 随 机 森林 (Random 
Forest，RF ) .决策 树 ( Cradient Boosting Decision Tree ， 
GBDT) 以 及 近 令 法 (K-Nearest Neighbor，KNN ) 等 ， 
针对 不 同 的 场景 和 分 类 问题 ,不 同 机 咒 学 习 算 法 各 自 
都 有 广泛 的 应 用 。 

选用 准确 率 (accurate rate) 、 精 确 率 (precision 
rate) 、 召 回 率 (recall rate) 和 下 1 值 多 个 指标 对 机 器 学 
习 效果 进行 综合 评价 。 准 确 率 为 所 有 正确 分 类 的 专利 
文档 数目 与 全 部 专利 文档 数 的 比率 ,能 够 较为 直观 地 
衡量 机 器 学 习 算 法 的 识别 和 分 类 效果 ;精确 率 为 准确 
分 类 专利 文档 数 与 所 有 预测 为 该 类 文档 数 的 比率 ; 召 
回 率 为 准确 分 类 文档 数 与 实际 文档 数 的 比率 ;Fl 值 为 
同时 考虑 精确 度 和 召回 率 的 综合 性 评价 指标 。 由 于 本 
研究 为 多 分 类 问题 ,因此 需要 在 每 个 二 分 类 评价 指标 
基础 上 ,进一步 计算 整体 的 综合 评价 指标 ,本 研究 使 用 
“ 宏 _(macro_)” 的 计算 方法 。 二 分 类 问题 和 多 分 类 问 
题 评价 指标 的 具体 计算 公式 如 表 5 所 示 。 

表 5 机 器 学 习 二 分 类 和 多 分 类 问题 的 评价 指标 


二 分 类 多 分 类 
准确 率 (A) A = 而 TTN+ RPR mA 
精确 率 (P) 。 P= 二 RE macro_P = 饼 
召回 率 (R) i waco R= 
FI 值 P= n° 


因此 ,本 研究 选用 所 有 上 述 5 类 机 器 学 习 算 法 ,使 
日 交叉 验证 的 方法 ,在 训练 集 上 通过 最 大 化 综合 指标 
Fl 值 进行 参数 调 优 。 最 终 参 数 选择 为 : 文 持 向 量 机 算 
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法 取 cost =0.6, loss =0.1, nu =0.5; 梯 度 提 升 算法 取 
tree depth = 10 ,learning rate = 0. 05 ;随机 森林 算法 取 
tree depth = 10 ;决策 树 算 法 使 用 Gini index, 最 小 描述 
长 度 (MDL) 原 则 ; K 临近 取 Kk=6。 此 时 求 得 各 机 器 学 
习 方 法 在 训练 集 实现 的 准确 率 、 精 确 率 、 召 回 率 和 也 
值 如 表 6 所 示 : 

表 6 机 器 学 习 方法 在 训练 集 的 效果 


支持 向 量 机 梯度 提升 ”随机 森林 ”决策 树 。 临近 

准确 率 (A) 98.89% 99.37% 99.37% 75.73% 72.95% 

精确 率 (P) 99.41% 99.05% 99.62% 64.17% 72.36% 

召回 率 (R) 96.46% 98.59% 98.17% 51.37% 40.61% 

Fl 值 97.92% 98.82% 98.89% 57.06% 52.02% 
2.4.2 测试 集 上 确定 最 优 模型 


依据 训练 集 所 得 各 机 器 学 习 方法 参数 值 设 定 , 通 
吉 芝 又 验证 的 方法 测试 各 类 机 器 学 习 方法 的 效果 , 相 
同 的 方法 可 以 计算 出 各 评价 指标 。 表 7 展示 各 类 机 器 
学 可 算法 在 测试 集 数据 上 的 准确 率 ,精确 率 、 召 回 率 和 
E 值 ,其 中 粗 体 显示 的 随机 森林 各 项 指标 的 综合 评估 
效 旺 较 好 ,其 中 准确 率 为 75. 28% ,召回 率 为 60.27% ， 
FE 稍为 64.39% 。 


2.4.3 全 数据 集 上 专利 识别 与 分 类 

利用 随机 森林 的 机 器 学 习 方 法 对 数据 集 进 行 识别 
和 分 类 。 统 计 2014 -2018 年 间 美 国 的 加 密 安 全 移动 
支付 数据 分 析 、 物 联网 络 、 智 能 交易 以 及 网 络 借贷 6 
类 金融 科技 专利 每 年 的 授权 数目 ,情况 如 表 8 所 示 。 
结果 显示 ,2014 年 美国 金融 科技 授权 数量 为 417 条 , 达 
到 小 高 峰 ,2015 年 有 所 下 降 , 仅 为 198 条 ,但 随后 呈现 
逐年 稳定 增长 的 趋势 。2011 年 金融 科技 的 概念 被 正 
式 提出 ,金融 与 科技 的 融合 逐渐 由 互联 网 金融 模式 
走向 金融 科技 的 新 模式 。 在 此 之 前 ,依托 成 熟 的 互联 
网 技术 ,各 类 相关 专利 技术 爆发 式 产生 ,特别 是 以 移动 
支付 智能 交易 和 网 络 借贷 类 为 代表 的 技术 布局 较 快 ， 
表现 在 2014 年 中 此 三 类 和 总 体 金融 科技 专利 的 授权 
数目 较 多 。 此 后 ,金融 科技 进入 纵深 发 展 的 阶段 ,与 区 
块 链 、 云 计算 、 人 工 智能 等 底层 技术 的 融合 逐步 加 深 ， 
相关 技术 研发 和 布局 平稳 进行 ,因此 2015 年 后 各 类 金 
融 科技 专利 逐渐 呈现 出 平稳 增长 的 态势 ,金融 科技 整 
体 发 展 进 入 稳定 增长 的 成 熟 期 。 

表 8 2014 到 2018 年 间 美 国 金融 科技 授权 专利 情况 


Rs SE (单位 :条 ) 
表 7 机 器 学 习 方 法 在 测试 集 的 效果 - - 一 一 四 
类 别 加 密 移动 数据 物 联 智能 网 络 总 计 
= 支持 向 量 机 梯度 提升 ”随机 森林 ”决策 树 ” 下 临近 年 份 安全 支付 分 析 网络 交易 借贷 
> 72.22% 71.94% 75.28% 70.83% 67.22% 2014 49 147 38 2 118 38 417 
CN 
是 骸 确 率 (P) 70.25% 67.57% 69.10% 57.56% 61.23% 2015 30 91 22 23 30 之 198 
好 回 率 (R) 49.9% 49.16% 60.27% 45.00% 36.12% 2016 34 104 30 19 19 1 207 
Fl 值 58.36% 56.92% 64.39% 50.51% 45.44% 2017 55 149 40 22 Wy 6 287 
\ 2018 58 191 32 24 32 2 348 
人 pa 有 目 .1 yh 等 中 LN》 时 上 个 > 
CS 随机 森林 是 以 决策 树 为 基本 分 类 器 的 一 个 集成 学 0 


习 和 模型, 它 包含 多 个 由 集成 学 习 技 术 训 练 得 到 的 决策 
树 人 当 输 入 待 分 类 的 样本 时 , 最 终 的 分 类 结果 由 单个 决 
策 树 的 输出 结果 投票 决定 。 随 机 森林 克服 了 决策 树 过 
拟 合 问题 ,对 噪声 和 异常 值 有 较 好 的 容忍 性 , 对 高 维 数 
据 分 类 问题 具有 良好 的 可 扩展 性 和 并 行 性 。 此 外 ,随机 
森林 是 由 数据 驱动 的 一 种 非 参数 分 类 方法 ,该 算法 被 广 
泛 应 用 到 诸如 生物 信息 、 商 业 管 理 文本 分 类 ,经 济 金融 
等 实际 领域 。 综 合 所 得 数据 来 看 ,随机 森林 方法 对 于 本 
问题 的 专利 识别 和 分 类 效果 最 好 ,因此 本 研究 最 终 使 用 
随机 森林 模型 对 金融 科技 专利 进行 识别 与 分 类 。 


与 此 同时 ,所 得 的 金融 科技 专利 数据 中 共 涉 及 
618 个 IPC 号 ,统计 每 类 专利 中 数量 排名 前 五 的 IPC 
号 ,如 表 9 所 示 。 结 果 显 示 , 一 方面 ,全 部 金融 科技 专 
利 涉及 的 IPC 号 范围 广泛 ; 男 一 方面 ,不 同类 别 金融 科 
技 专利 的 IPC 号 分 布 亦 存在 较 大 差异 。 因 此 ,这 也 说 
明 应 用 传统 的 检索 方法 , 较 难 全 面 准 确 地 对 金融 科技 
专利 进行 分 析 。 此 外 ,本 研究 的 结果 ,也 能 够 为 未 来 利 
日 了 PC 号 检索 和 分 析 金 融 科 技 专 利 , 以 及 构建 IPC 号 
与 相关 产业 间 关 联 等 研究 工作 提供 参考 和 借鉴 。 


Pe | 


表 9 各 类 金融 科技 授权 专利 的 IPC 分 布 情况 


ge 奖 列 加 密 安全 移动 支付 数据 分 析 物 联网 络 智能 交易 网 络 借贷 
1 G06Q20/40 G06Q20/32 GO06Q40/00 GO6K07/10 GO06Q40/00 GO06Q40/00 
2 H04129/06 G06Q20/40 GO6F17/30 G06Q20/32 G06Q40/06 G06Q40/02 
3 G06Q40/00 GO06Q40/00 G06Q30/02 GO6K19/07 GO06Q40/04 G06Q20/10 
4 G06Q20/00 G06Q20/20 H04L29/06 H04Q05/22 GO06Q40/08 GO06Q30/00 
5 G06020720 G06020710 G06Q10706 G06020720 G06040702 G06030706 
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3 ”金融 科技 专利 数据 分 析 


本 部 分 将 依据 所 得 分 类 专利 数据 ,从 类 别 分 布 和 
业务 应 用 角度 ,对 金融 科技 的 发 展现 状 进行 分 析 和 总 
结 。 

3.1 类 型 分 布 分 析 

按照 加 密 安 全 移动 支付 .数据 分 析 、 物 联网 络 . 智 
能 交易 和 网 络 借贷 6 个 类 别 对 金融 科技 专利 进行 统 
计 。 如 图 2 所 示 ,移动 支付 类 的 金融 科技 专利 数量 最 
多 共有 682 条 ,加 密 安全 和 智能 交易 紧 随 其 后 ,分 别 有 
226 条 和 214 条 。 相 对 而 言 ,网 络 借贷 类 的 金融 科技 专 
利 最 少 , 仅 有 58 条 。 从 图 3 各 类 金融 科技 专利 发 展 趋 
势 来 看 ,移动 支付 类 金融 科技 专利 占 比 一 直 保持 较 高 
玫 开 , 平 均 占 比 为 47% 且 革 现 逐 年 扩大 的 趋势 ,此 外 
加 密 安 全 ,数据 分 析 和 物 联网 络 的 占 比 也 较为 稳定 , 平 
均 虹 比分 别 为 16% 11% 和 8% 。 与 此 相 比 ,智能 交易 
os 15% ， 

络 借贷 类 专利 的 总 体 占 比 最 小 ,平均 仅 为 4% ,但 
其 第 下 降 后 略 上 升 的 变化 趋势 。 
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2 金融 科技 类 型 总 体 分 布 


目 加 密 安 全 下 移动 支付 日数 据 分 析 卓 物 联网 络 目 智 能 交易 目 网 络 借贷 


占 比 (%) 


2014 2015 2016 2017 2018 年 
图 3 各 类 金融 科技 专利 变化 趋势 


无 论 从 绝对 数目 还 是 发 展 趋势 来 看 ,移动 文 付 类 
金融 科技 专利 技术 都 有 着 绝对 优势 , 且 保 持 稳定 增长 。 
而 智能 交易 类 专利 技术 总 体 数量 居中 但 逐渐 缩减 ,网 


络 借贷 类 专利 技术 的 绝对 数目 和 占 比较 少 ,但 近年 呈 
现 增长 趋势 ,具有 一 定 的 发 展 空间 。 未 来 随 着 5C 技 
术 、 人 脸 识 别 技术 等 的 成 熟 和 应 用 ,移动 支付 领域 仍 为 
金融 科技 布局 的 重点 潜力 领域 ,此 外 区 块 链 技术 的 成 
熟 也 将 为 加 密 安全 和 网 络 借贷 等 专利 布局 带 来 新 的 发 
展 机 遇 。 
3.2 业务 应 用 分 析 

金融 科技 专利 的 应 用 业务 场景 ,可 以 划分 为 银行 
业务 ,资本 市 场 业务 .保险 业务 ,支付 业务 、 借 贷 业 务 和 
非特 定 业务 , 共 7 大 类 。 进 一 步 通过 阅读 标题 .摘要 并 
结合 IPC 号 等 信息 ,对 所 得 各 类 金融 科技 的 应 用 业务 
场景 进行 统计 和 分 析 。 从 不 同业 务 应 用 金融 科技 专利 
总 数 来 看 ( 见 图 4) ,非特 定 业 务 的 专利 数目 最 多 , 共 
770 条 , 占 45. 8% ,其 次 为 支付 业务 共 460 条 , 占 
27.3% ,再 者 为 银行 业务 , 共 290 条 , 占 17.2% 。 相 比 
而 言 ,金融 科技 专利 在 保险 业务 和 借贷 业务 中 的 应 用 
较 少 ,分 别 为 31 条 和 32 条 , 仅 占 总 体 的 2% 左右 。 


保险 业务 ，31 条 
借贷 业务 ，32 条 


图 4 金融 科技 专利 总 体 的 行业 应 用 情况 


从 不 同业 务 应 用 金融 科技 专利 的 具体 类 型 来 看 ， 
5 展示 了 每 种 业务 领域 内 ,应 用 数目 排名 前 两 位 的 
专利 类 别 。 结 果 显 示 ,银行 业务 ,支付 业务 以 及 非特 定 
业务 中 ,应 用 较 多 的 分 别 为 移动 支付 和 加 密 安 全 类 的 
金融 科技 专利 ,资本 市 场 业务 和 保险 业务 中 则 较 多 应 
用 智能 交易 和 数据 分 析 类 的 金融 科技 专利 ,而 借贷 业 
务 中 移动 支付 和 网 络 借 贷 类 金融 科技 专利 数目 排名 靠 
前 。 

综 上 ,当前 金融 科技 专利 最 主要 的 应 用 行业 包括 
传统 金融 行业 中 的 银行 业务 ,以 及 依托 互联 网 金融 兴 
起 的 支付 业务 ,科技 与 相应 金融 业务 的 结合 较为 深入 。 
同时 ,本 研究 发 现 移动 支付 和 加 密 安 全 类 金融 科技 专 
利 的 应 用 场景 最 为 广泛 ,能 够 在 银行 业务 支付 业务 以 
及 其 他 非特 定 业 务 中 提供 交易 支付 便利 和 信息 安全 保 
障 。 相 比较 而 言 ,智能 交易 主要 应 用 于 资本 市 场 业 务 
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一 > 一 > 
数目 最 多 数目 次 多 
加 密 安 全 银行 业务 
移动 支付 资本 市 场 业 务 
数据 分 析 
保险 业务 
智能 交易 借贷 业务 
网 络 借贷 支付 业务 
非特 定 业务 


图 5 金融 科技 专利 类 别 的 行业 应 用 情况 


和 保险 业务 ,提供 智能 化 的 股票 和 保险 推介 ;而 网 络 借 
贷 类 专利 ,如 “P2P” 和 “ 众 筹 ”等 相关 技术 , 则 推动 了 新 
型 借贷 业务 的 发 展 。 


4 


本 研 究 依据 金融 科技 的 内 涵 和 功能 ,梳理 创新 的 


类别 ,从 而 厘清 金融 科技 专利 的 范围 。 随 后 ,使 用 机 器 
学 村 算法 ,结合 文本 过 滤 、 人 工 判 读 ,构建 了 金融 科技 
识别 与 分 类 的 模型 ,实现 自动 化 的 专利 检索 。 同 
HD 针对 所 得 分 类 数据 ,本 研究 亦 初 步 探讨 了 金融 科技 
的 发 展现 状 。 面 临 领域 交叉 .技术 体系 繁杂 和 体 
量 政 大 的 专利 数据 时 ,传统 的 专利 检索 方法 存在 检索 
ee eb i 
利 检 索 流程 ,对 此 类 新 兴 交 叉 领 域 专利 分 析 具 有 一 定 
的 车 鉴 意义 。 此 外 ,同样 重要 的 是 ,本 研究 亦 能 够 为 未 
来 时 金融 科技 企业 创新 性 .产业 发 展 影响 因素 等 重要 
问题 的 深入 探究 提供 可 靠 的 专利 数据 及 获取 方法 。 因 
此 ,本 研究 具有 理论 和 实践 的 双重 意义 。 
在 未 来 的 研究 工作 中 ,还 可 以 进一步 优化 文本 处 
理 的 方法 ,提升 机 器 学 习 分 类 模型 的 准确 性 ;扩展 数据 
集 的 范围 ,进行 全 球 专利 数据 的 分 析 , 此 时 需要 对 国家 
间 差 异 等 方面 做 出 更 加 细致 的 考虑 。 同 时 ,后 续 可 以 
进一步 将 金融 科技 的 专利 授权 数据 与 公司 微观 数据 、 
行业 中 观 数据 以 及 经 济 宏观 数据 相关 联 , 从 而 深入 探 
讨 如 何 从 公司 治理 和 制度 建设 角度 ,促进 金融 科技 创 
新 的 持续 平稳 发 展 。 
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Absiract: | Purpose/significance | FinTech has developed rapidly in the information and data era, and the 


Fimber of patents has continued to increase. At the same time, its field crossover and blurred borders characteristics 


ve also increased the difficulty of patent analysis. Therefore, it is necessary to construct a suitable identification 


Tid classification method, so as to accurately and efficiently process the continuously growing large volume data. 


ethod/process | This paper firstly sorted out the innovation categories based on the connotation and function of 


FinTech, and thus clarified the scope and boundaries of FinTech patents. Then, it constructed a FinTech patent rec- 


图 
eoBnition and classification model based on machine learning algorithms, combining text filtering and manual interpre- 


Caiion. | Result/ conclusion | This paper proposes a patent recognition and classification process, based on machine 


rning algorithms, which is more accurately and efficiently. By analyzing the obtained FinTech patent classification 


CBta, the research also summarizes the current FinTech development status. 
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所、 会 议 背景 
和 年来 ,国内 许多 图 书包 在 党 销 推广 方面 积累 了 丰富 的 经 验 ,树立 了 良好 


的 社会 影响 ,也 为 图 书馆 自身 创造 了 良好 的 发 展 环境 。 为 更 好 地 总 结 各 馆 的 先 
进 经 验 ,分 享 研究 成 果 ,推动 图 书馆 更 好 地 做 好 营销 推广 ,面向 “十 四 五 ”制订 
营销 推广 战略 规划 ,杭州 图 书馆 与 《图 书 情报 工作 》 杂 志 社 预计 于 2020 年 7 
月 上 旬 在 美丽 的 杭州 联合 主办 “2020 图 书馆 营销 推广 策略 与 战略 学 术 研 讨 


J 
0o 


会 议 将 邀请 图 书馆 界 从 事 相关 研究 和 实践 的 专家 学 者 等 人 员 ,分 享 图 书馆 
营销 推广 的 实践 进展 与 学 术 成 果 。 欢 迎 相关 领域 研究 、 实 践 和 管理 人 员 踊 跃 报 
名 参 会 。 同 时 ,面向 全 国 各 级 各 类 图 书馆 工作 者 征文 ,优秀 论文 左右 将 有 机 会 


在 会 上 交流 ,优秀 论文 将 在 《图 书 情报 工作 》 等 参 会 期 刊 上 正式 发 表 。 
二 、 组 织 机 构 
主办 单位 :杭州 图 书馆 ;《 图书 情报 工作 》 杂 志 社 
三 ,会 议 征文 


通过 邮箱 (journal@ mail las. ac. cn ) 提交 ,投稿 时 请 注 明 “杭州 会 议 :论文 
题目 ”。 论 文 撰写 要 求 及 格式 请 参考 《图 书 情报 工作 》 网 站 (www. lis. ac. cn) 
“投稿 须知 ”, 严 格 遵守 学 术 规 范 和 学 术 道德 。 会 议 将 组 织 专家 对 投稿 论文 进 
行 评议 ,优秀 论文 安排 会 议 交流 ,并 推荐 《图 书 情报 工作 》 等 参 会 期 刊 发 表 。 

投稿 截止 日 期 :2020 年 6 月 10 日 。 

四 、 会 议 时 间 和 地 点 

会 议 时 间 : 暂 定 2020 年 7 月 上 名 ,具体 日 期 将 根据 疫情 情况 和 上 级 的 相关 
指导 意见 ,另行 通知 。 

会 议 地 点 :杭州 市 


2020 图 书馆 营销 推广 策略 与 战略 学 术 研 讨 会 征文 与 会 议 通知 


五 .会 议 学 术 活 动 

(1) 专 家 学 者 报告 

(2) 优 秀 论文 分 享 

(3) 交 流 互动 

六 、 会 议 缴费 与 报名 

普通 代表 :800 元 ,学 生 代表 :600 元 。 现 场 报 名 缴费 标准 (现金 形式 ): 
1000 元 。 

报名 二 维 码 : 


8 其 他 

会 务 联 系 人 : 张 蔚然 , 刘 艳 

电话 :0571 - 86535068 ;86535014 ;17364592101。 
E-mail:315643496@qq. com 


杭州 图 书馆 
《图 书 情报 工作 》 杂 志 社 
2020 年 3 月 17 日 
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